윈도우에서 문자열 인코딩 문제

윈도우에서 문자열의 인코딩 문제 움라우트(Umlaut) UTF-8test.txt에는 다음의 내용이 저장되어 있다. “création d’un rôle”,””ÿ”” “初演”,”重役” “초연”,””중역”이라고” <문자열> 장에서 좀 더 자세히 살펴보겠지만, 쉼표로 구분되고, “가 인용부호로 쓰인 데이터 화일로 생각할 수 있다. 이를 R의 기본 함수인 read.csv, readr::read_csv, data.table::fread로 읽어보면 결과는 다음과 같다. dat1 <- read.table(‘UTF-8test.txt’, sep=’,’, fileEncoding=’UTF-8′, stringsAsFactors=FALSE); dat1 dat2 <- readr::read_delim(‘UTF-8test.txt’, delim=’,’, col_names=FALSE); dat2 … 윈도우에서 문자열 인코딩 문제 계속 읽기